डेटा की दुनिया पिछले एक दशक में नाटकीय रूप से बदल गई है। पारंपरिक डेटाबेस, जो एक संरचित प्रारूप में जानकारी संग्रहीत करने के लिए डिज़ाइन किए गए थे, असंरचित डेटा के विशाल गोदामों में विकसित हुए हैं जो विभिन्न स्थानों पर कई सर्वरों पर बैठते हैं। बहुत समय पहले की बात नहीं है, हम ओरेकल और आईबीएम जैसे बीहमोथ्स के वर्चस्व वाले मोनोलिथिक सिस्टम को देखने के आदी थे। यदि आप एक विश्लेषक या व्यावसायिक उपयोगकर्ता हैं, जिन्हें इस प्रकार के डेटा तक पहुंच की आवश्यकता है—और किसे नहीं?—इसका मतलब धीमी गति से चलने वाले सिस्टम हैं जिन्हें प्रबंधित करना अविश्वसनीय रूप से कठिन था।
सिस्टम की बढ़ती जटिलता ने अंततः आधुनिक सॉफ़्टवेयर स्टैक की आवश्यकता को समाप्त कर दिया जो संगठनों को लागत प्रभावी रहने के प्रबंधन के दौरान जटिल एप्लिकेशन चलाने में मदद कर सकता है। ओपन सोर्स मूवमेंट ने जटिल अनुप्रयोगों को एक साथ रखने की लागत को नाटकीय रूप से कम करके, जैसे कि पूर्ण-पाठ खोज के लिए लोचदार खोज और मॉडलिंग के लिए PyTorch में मदद की। सॉफ्टवेयर की मजबूत पैकेजिंग और संचालन ने सिस्टम की उपयोगिता, स्थिरता और अर्थशास्त्र में सुधार किया।
द मॉडर्न डेटा स्टैक (एमडीएस), जिसने पिछले एक दशक में बहुत अधिक कर्षण देखा है, ओपन सोर्स मूवमेंट पर आधारित है और उद्यम डेटा स्टैक बनाने के उद्देश्य से विचारों, उपकरणों और कार्यप्रणाली का एक संग्रह है।
2010 के दशक में, हमने एमडीएस के भीतर ओपन सोर्स टूल्स को तेजी से अपनाया। हालाँकि, उनकी प्रारंभिक सफलता के बाद, जब उन्हें स्केल करने की बात आई तो इनके आसपास कई संगठनों की पहल चुनौतियों का सामना करना पड़ा:
अंक # 1 और # 2 ने उद्योग में तनाव के स्तर को जोड़ने और प्रौद्योगिकियों को अपनाने और उपयोग करने के लिए उपलब्ध प्रतिभा को सीमित करने में एक प्रमुख भूमिका निभाई है। हमने DevOps स्पेस में एक समान प्रवृत्ति देखी है, जिसमें डेवलपर प्रतिभा की आपूर्ति नई डिजिटल सेवाओं की मांग को पूरा नहीं कर रही है। डेल कैपिटल के टायलर ज्वेल इस समस्या के बारे में काफी मुखर रहे हैं - जो उच्च बर्नआउट की ओर ले जा रहा है, और एक पेशेवर डेवलपर की औसत करियर अवधि 20 साल से कम है। उन्होंने हाल ही में एक थ्रेड पोस्ट किया जहां उन्होंने डेवलपर के नेतृत्व वाले परिदृश्य में जटिलता में गहरा गोता लगाया, और हम मदद नहीं कर सकते लेकिन उनके दावों और एमएलओपीएस स्पेस के बीच कई समानताएं देख सकते हैं।
अंक #3 और #4 आज के डेटा लोगों की दुर्दशा को उजागर करते हैं-यदि समस्याओं को हल करना पर्याप्त नहीं था, तो वे यह पता लगाने में अधिक समय व्यतीत करते हैं कि वे "कैसे" आगे बढ़ सकते हैं और समस्याओं को हल करने में सक्षम होने के बिना समस्याओं को हल कर सकते हैं। करने की जरूरत है, या अपेक्षित परिणाम।
हम संगठनों द्वारा उपयोग किए जाने वाले डेटा टूल में बदलाव देख रहे हैं, जो एक बढ़ी हुई मान्यता से प्रेरित है कि उनमें से कई के पास अपनी बुनियादी ढांचे की जरूरतों के लिए तीसरे पक्ष के विक्रेताओं पर भरोसा करने के अलावा कोई विकल्प नहीं है। यह न केवल बजट की कमी के कारण है, बल्कि अन्य बाधाओं के कारण भी है, जैसे डेटा सुरक्षा और उद्गम।
इसके अलावा, स्वचालित प्रक्रियाओं की मांग में वृद्धि हुई है जो उद्यमों को संचालन को बाधित किए बिना या डाउनटाइम के कारण आसानी से एक प्रदाता से दूसरे में कार्यभार स्थानांतरित करने की अनुमति देती है। हम वित्तीय सेवाओं जैसे उद्योगों के भीतर इनका प्रभाव देख रहे हैं जहां सफलता के लिए डेटा प्रबंधन अक्सर महत्वपूर्ण होता है (उदाहरण के लिए, क्रेडिट रेटिंग एजेंसियां)।
इन सभी के साथ-साथ ऊपर सूचीबद्ध चुनौतियों के परिणामस्वरूप, समुदाय में कई विकास हुए हैं:
मैं
मैं
पूरे उद्योग में टूल और प्लेटफ़ॉर्म का समेकन, सरल प्लेटफ़ॉर्म विकास और प्रबंधित सेवाओं का उपयोग हो रहा है। यह व्यवसायों की जटिलता से निपटने की आवश्यकता से उपजा है। इस स्थान का हिस्सा बनने का यह एक रोमांचक समय है, और मैं यह देखने के लिए इंतजार नहीं कर सकता कि वर्ष के दौरान परिदृश्य कैसे विकसित होता है।
स्क्रिबल डेटा में, (जिस कंपनी की मैंने सह-स्थापना की है) हम इस विकास के बारे में गहराई से जानते हैं क्योंकि यह हो रहा है। हम एक विशिष्ट समस्या पर ध्यान केंद्रित करते हैं - उन्नत विश्लेषिकी और डेटा विज्ञान उपयोग मामलों के लिए फीचर इंजीनियरिंग। यह समस्या स्थान महत्व के रूप में लगातार विकसित हुआ है और उन तरीकों से विकसित हुआ है जो उपरोक्त बिंदुओं के अनुरूप हैं। सही प्रौद्योगिकी मिश्रण और समाधान फोकस के साथ, उपयोग के मामलों के लिए उत्पाद मूल्य को संरेखित करना संभव है, जबकि प्रत्येक उपयोग के मामले के लिए 5x तेज समय से मूल्य (टीटीवी) प्राप्त करना संभव है।
यहाँ भी प्रकाशित